Model Selection

OCR Optimization

# OCR Optimization

Mlcd Vit Large Patch14 336

A visual feature extraction model based on ViT-L/14@336px architecture, surpassing CLIP benchmarks in multiple multimodal tasks

Multimodal Fusion

Detr Resnet 50 Finetuned OCR

An OCR model fine-tuned from facebook/detr-resnet-50 for object detection tasks

Text Recognition

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase